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^arallelstrategie 

>ftware fur Rechner-Cluster 
itwickein p.^i ^lX:~Otl- /CjC^c^ 

t Linux tossen sich zwar fur wenige fausend Mark 
stungsfahige Rechner-Cluster aufbauen, oft 
ingelt es aber an der passenden Software, 
s trifft 3D*Grafiker barter ols Forscher und 
:hniker, die ebenfalls einen gehdrigen Appetit 

Rechenleistung verspuren. Sie schreiben 
* Software fur Simulationen und numeriscbe 
lerimente meist selbst - und konnen sie deshalb 
nell auf einen Cluster umsetzen. Beim Bastein 

Algorithmen helfen bewdhrte Richllinien. 
J die notige Betrtebssoftware steht zum Beispiel 

dem kostenlosen System PVM bereit. 



Von lun Foster 1 1 1 s tarn ml 
der jlljiemeiii ;incrkjnnte *me- 
ihtKlischc Enivvurr fiir Soft- 
ware, die ;uir Coinpiiiern mil 
mchrcrcn paralielcn Recheti- 
werken I an Ten soil - ob Vcku)r- 
Supercompiiicr Marke Cray. 
Windows - Mulli processor- PC 
Oder Linux-Clusrcr. In Ankh- 
nung an Foster kann man mil 
einem hardwareunabhiiniiigen 
Entwurf beginnen und diesen 
anschlieGend an die jeweiligc 
Maschinc anpassen. 

Den Entwurf geht man rn 
vier Schritien an: 

- Pariilionicrung (Zerlegiing in 
Teilaufgabcn). 

- Auslegung der Kommunika- 
(iun. 

- Agglomeration (Biindelung von 
Aufgaben). 

-Mapping (Aiifteilung aiif 

Prozessoren). 
Die er^iten beiden Schriiie 
7.ielen auf Nebenlaiitlgkeit - das 
eigentliche Parallelrechncn - 
und Skalierbarkeit. der Be- 
schleunigiing mit /.uneh mender 
Zahl an Pro/.essoren. Die let/ ten 
Schriiie bcrucksiehtigen die 
Eigensehaften der vorhandenen 
Hardware. Zum Beispiel legl 
man Pro/csse. die vide Daien 
miicinander aiisianschen iniis- 
sen, am bestcn auf dense I hen 
Pri>2Cssor. 

Partilifinieruno: |n diesem 
Schriit wird die Berechnitng in 
moglichsi viele Teilaufgaben 
/erlcgl - "granularisieri*. Man 
ignoriert die laisaehliche Zahl 
der Pro/.essoren. sondern gehi 
/uniiehsi da von a us. eine genii- 
gende An/ah I /,ur Verfiigung /u 
haben. Im weseni lichen gill es. 
guic Konzepie zur Parallelisie- 
rung /u verfolgen. Dies schaffi 
das groBte Potential fiir die 
parallele Ausfiihrbarkeit: die 
Opiin>ierung auf die Zie larch i- 
lekiur folgi spaier. 

Eine guie Paniiioniening 
untcrieili so wo hi die Rechen- 
schrilie (Functional Decompo- 
sition) als auch die Daien 
(Domain Decomposition*. Ein 
Beispiel fiir das erst ere ware. 
/Air Klimavorhersage die O/.eane 
von einem anderen Prozes.sor 
bearbeiien /u lassen als die 
Atmosphiire: auch die Dateti 
konnte man hier unterteilen. 
beispielsweise in .Noril- und 
Siulhalbkugel. Urn den Kom- 
muntkationsaufwanti zu ver- 
kleinern. kann es sinnvoti 
sein. ideniische Daien bei meh- 
reren Prt^/essen /u speichern 
(Replikaiionk 



Auslegun^ der Kommuni- 
kation: Die Teilaufgaben lau- 
schen Daien miicinander aus - 
im Beispiel ware das eiwa die 
Temp>eraiur der Meeresober- 
Hache oder die Lufibcwegungen 
am A(.]iiat<>r. In der zwciien 
Phase uniersuchi man den 
Kommunikaiionsaufvvand und 
versucht, effizienie Verfahren 
dafiir 7,u tlnden. Beim einfachen 
Masier/Slave-Modell. in dem 
die Slavc-Pro/.esse untereinan- 
der keine Naehrichien ausiau- 
schen. mu6 lediglich imtersuchi 
vverden. ob es am Master zu 
einem Datensiau kommen kann. 

Schwieriger /u analysicren 
sind verleilie Anwendungen. 
hei denen fast jeder ProzeU mil 
fast jedem anderen Daten aus- 
lauscht. Beispielsweise laufi ein 
Pro/es.sor. der auf die Ergebnis- 
se eines anderen wartci. nuizlos 
im Leerlauf. Bei komplizicrie- 
ren Anwendungen kann sogar 
der gesanite Rechenpro/eli vol- 
Irg bKK'kieri werden rDcail- 
lock*». eiwa weil Pro/el.^ A auf 
ein Ergebnis von Pro/eU B 
wartet. B aber gleich/eiiig auf 
ein Ergebnis von A. 

A;jplonicr:ition; Nachdem es 
in den ersien zwei Schritien 
lediglich umdie Parallelisicrung 
ging. beach le I man in der 
driiten Phase die Leistung und 
die Kosien der Hardware. Er- 
weisen sich die Hrgebnisse der 
Zerlcgung fciner. als es ange- 
sichts der vert'iigbaren Zahl von 
Pro/essoren si nn vol I isi. muC 
man Enischeidungen aus tien 
ersten .Abschniiten revidieren: 
dann werden bislang getrennie 
Aufgaben \ ereini. inn mil weni- 
ger Pro/essoren und geringerem 
Kommunikaiion.saufwaud aus- 
/ukommcn. 

Mapping: Zulei/i wird fesi- 
gelegi. welche Pnv.csse /iisain- 
nien auf einem besiimmrcn Pro- 
zessor laufen sollen. Das kann 
ein fiir allemal fest vorgcgeben 
sein oder dynamise h beim Pro- 
gramiiiab la uf enischieden wer- 
den. Vollziehi die Anwendung 
regelmaBige Rechen- und Kom- 
munikatii>nsimisier und latifi 
/udem in einer storimgsfreien 
Umgebung. hieiei Nich ein sta- 
lisches Mapping an: dieses 
kann man sorgfaliig opiiniieren. 
Viele Umgehungen erfordern 
jeduch ein <lynamisches Map- 
ping, zum Beispiel ein Cluster, 
an dessen Rechner /usaizlich 
lokale Beiuiizer arbeiien. 

Lei der laufen die vier Teil- 
schriiie ties 'meihtxfischen Ent- 
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wuriV nicht sfrikc nachcinniider 
ab. So kann es bcispielsueise 
passiercn. d;i« die Verieiluna 
iJer Aufgjben auf Prozcssoren 
NClbsi einc neuo Aulgobc 
iiencricrt: die dynaniische Lasl- 
veneiluns. 



xpvm stellr Ressourcen und 
genutxte Rechenleislung dor. 
Es zeigt den zeitlichen Ablaul 
der Nachrichten und 
extrohiert Sender, Empfonger 
sowie Message Togs. 



N ben- und miteinander 



Es aib( im wesemlichcn drei 
Konzepte. Programme mil Hilfe 
mehrercr CPUs zu bcschleuni- 
^on: Mulci threading und Shared 
Viriual Memory tur Rcchner. in 
clenon mehrere Prozessoren aut' 
denselbcn Speicher zu^reifen. 
und Mess age Pass i n» z ur 
Vcrbindung durch Ausiausch 
von Nachrichten 

Untcrsriiizi das Betriebs- 
systcm den Muliiprozessor- 
beirieb. liiBl sich am einJ'ach- 
sten Leisiung gewinnen. indem 
man die Aufgaben auf mehrere 
nebenlaufige Threads veneilt - 
leichigewichtige Prozcsse in 
einem gemcinsamen AdreB- 
raum. Threads gemiiB POSIX- 
Standard rlnden sich in Linux 
und Windows NT. Hier eni- 
scheidei das Beiriebssvstem, 
wann welcher Prozcli auf wel- 
chcm Prozcssor lauft. Sinnvol- 
Icrweise verwendet man mindc- 
siens so viele Threads, wic Pro- 
zessoren bereiistehen. 

Die Threads habcn ailc 
Zugriff aul' denselbcn Speichcr- 
raum (anders als eigenslandiue 
Prozessc. bei dene^n das er^si 
<urch Shared Memory nach- 
:cbildei werden muB)/Threads 
vonnen deshaJb Daien schnell 
niteinander ausiauschen: sic 
lurfen sich aber bcim ZugriJf 
luf gemeinsam genutzte Infor- 
nationen niche in die Quere 
lonimen: So konnte ein Thread 
me Datenstruklur aktualisieren. 
• ah rend ein andcrer sie uerade 
est - und deshalb ein Gemisch 
US alien mid neuen Datcn 
rhalt. Solche Siiuationen ver- 
indert man mit Hille von 
>emaphoren' (im urspruni:- 
chen Wonsinn Raggcn/eichen). 
lealerweise scizr der erste 
bread vor dcm Zugrilf cine 
;maph*)re; der Thread, der den 
'on venindern uilL imiB so 
Mge xvarten, bis der andcre 
iread die Semaphore wiedcr 
-Ngibl. 

Die Cirenzen der heuiiuen 
issystenjc liegen bei ehva 
hi Prozessoren per Mother- 
ard: aber schon Re^hncr mit 
-*r Prozessoren sind exirem 
(en. Der Trend gehi da/iin. 



Dual-Prozessor-Rechner als 
Knoien miteinander zum Clu- 
ster zu vemetzen. Dazu dient 
das Message Passing; mil scmcr 
HiKe sichr der Anwendungspro- 
grammierer zum Beispicfnichl 
vier Knoien ma I zwei Prozesso- 
ren. sondern acht Prozessoren. 
die IVei Oaten ausiauschen 
konnen; Die Kommunikaiion 
zwischen den Knoien geschiehi 
transparent. 

Bei Threads oder Shared Me- 
mory muB der Programmierer 
eher darauf achten. Dalenl'elder 
korrekt aulzuieilen. Dagegen hat 
er beim Message Passing sicher- 
zusiellen. daS jcde gesendetc 
Nachricht auch abgenommen 
wird. Die Fehlersuche hat es in 
sich: off fehli ein Debusger 
tier nicht nur Jokale Threads 
analysieren kann, sondern auch 
Prozesse, die auf einem eni- 
fernien Rcchner laufen. 

Wesentlicher Voneii des 
Message Passing ist die Skalier- 
barkcii. Gepackte Daten werden 
in Form von Nachrichten an 
einen Empfanger verschicki. der 
die.se Nachricht mitiels einer 
Emplangsroutine aurnimmt. Das 
klappt fur zwei Prozessoren auf 
demselben Motherboard ebenso 
wie fiir tausend im Internet 
vcrstreute Rechner. Message 
Passing kann auf ublichc 
Netzwerkschnittstellen autbauen 
aber eben.so spezielle Hardware 
und Software verwenden wie 
der Superrechner Intel Paragon. 
Von seiten der Beiricbssoftware 
ertordcn Message Passing aller- 
dmgs deutlich mchr Proiiram- 
niieraufwand als eiwa Shared 
Memory. 





Vorgefertigf 



Fiir Anwendungsprogram- 
micrer stehen Bibliotheken be- 
reit. die einen standardisienen 
Message Passmg Layer" unab- 
hang.g von der Hardware anbie- 
len. Typische Venreter sind 
MPI (Mcs.sage Passini: Inter- 
lace) und PVM fParaileF Vinual 
Machmc). MPI eicnci .sich 
hcrvorragcnd fur homosene 
Parallelrechner: mit 128 Befehlen 
bieiet es eine Fiillc von Kom- 
numikaiions. und Cmpix^nfunk- 



nonen. PVM dagegen ist die 
bessere Wahl fiir 'wild^ z.usam- 
mengestellie Cluster. Seine 36 
Funklionen erlauben, die Um- 
gebung zur Laufzeit dynamisch 
7u gesialten. Man kann nicht 
nur Prozesse hinzufiigen und 
enrfernen, sondern soiTar kom- 
pleite Rechner - in puncto Feh- 
Icnoleranz und Handhabbarkeit 
em enischeidender Vorieil. 

PVM will dcm Benutzereine 
moglichsi iransparenie, dvna- 
misch frei konfigurierbare Pro- 
grammierumgebung hicten (2| 
Ein Me-ssage-Passing-Algoriih- 
nius kann. fiir die jeweilige 
Hardware kompilien, parallel 
auf der sogenannien virtuellen 
Maschme ausgefiihrt werden. 
Auf den Einzelrechnem muB 
dabei nicht iiberall dassclbe Be- 
Inebssystem laufen: PVM ist 
liir nahezu alle Unix-Derivaie 
und fiir 32-Bit-Windows ver- 



(ugbar [31 Viele Linu.x-Di.siri- 
butionen.darunter S.U-S.E eni- 
haltcn die Software. 

PVM-Diimonen kontrollieren 
die virtuelle Maschine. Sie lau- 
fen dauerhaft auf jedem Knoten. 
verwaltcn die dortigen Prozesse 
und stellen die Verbindunecn 
her. Prozesse (Ta.sks) erhafien 
vom lokalen PVM-Damon eine 
fm Netz eindeutice Ideniillka- 
iionsnummer (ID): sie konnen 
Nachrichten an andere ID-Num- 
mem direkt verschicken oder 
vom Diimon weiterleitcn lasscn. 

Zwar fiihrt das dynami.sche 
Konzept zu LeistuncseinbiiBen 
Aber erst in speziellen H(K'h- 
ge.schwindigkcitsneuen (siehe 
Kasien auf Seite 150) erzieli 
PVM beim Aufbau und beim 
Durch.saiz der Verbindunsen 
Jeutlich schlechtere Resuhate 
als MPI. Leisfung urn jeden 
Preis ist aber gar nicht der Sinn 
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von PViVI. sondern bei spiels- 
wcisc die unproblema(j.sehe 
Konihinuiinn von H;irdu :ire aus 
vcrschiedenen 'Lagern*: So 
konvcnien es die Byie-Reihcn- 
tolce (liule endiim/bij: cndijn). 
un"i Njchrichien /wischen ver- 
schiedencn Rechnerpljicrormen 
koirekt auszuiauschen. 

PVM bieiei ein individucll 
iiesialibares Prourammierum- 
r'eld \'ur Wissenschali. For- 
■ichung und Praxis. An seine 
Son ware - S c hn i 1 1 s te J I e n las se n 
^ich zum Beispiel eigene 
Las[verieilungsaigoriihnien an- 
iocken. Anwender hnben auch 
r'in Checkpointing fiir PVM 
rniwickelt: damit laBt sich ein 
^wischensiand der Rechnung 
luf der Festplane siehern. um 
paler die Rechnung fortzii- 
iihren. Das rettei die Ergeb- 
lisse der Arbeit einer Woehe, 
Venn das System absiUrzi. 
\uBerdem vvird ProzeCniigraii- 
n nioglich: Ein eingefrorener 
'rozelJ kann auch auf einem 
nderen Rechner weicerlaiiten - 
uin Beispicl. weil der ur- 
:>rungliche Rechner ausgefal- 
:n isi. 

PVM erinubt. von zeni rater 
telle aus die Prozesse zu de- 
iggen. die aul' den Rechnem 
fs Clusters laulen. Hierzu mutJ 

Daten-Eilposf 

Die Bandbreite des Sysieni- 
?usses becrenzi die sinn voile 
\nzjhl an Prozessoren pro 
Einzelrcchner auf achi. aller- 
lochstens 16. Werdcn weitere 
'rozessoren benotigi. muO 
nan mehrere Rechner zum 
riuster verkntipfen. Proble- 
natii^ch wird dann die Kom- 
nunikation der Systeme: die 
Vllerwelisiechnik des (Fast) 
iihernei gerai bei einer 
lassiv parallclen Appiikaiion 
;:hncn an ihre Grenzen; so- 
ohl die Zeit. bis eine Nach- 
cht eintriffi (Laienzzeit), als 
uch die max i male Bandbreite 
inken der Leistung heuiigcr 
rozessoren um GroBen- 
rdnungen hinterhcr. 

cispiel: Mussen zuniichsi 
ele Kontrollnachrichien ver- 
hicki werden, die anschiie- 
rnd den cigenilichen Daien- 
:siausch iniiiieren. kann 
hon der Autrur der Sende- 
d Emptnngsrou linen des Be- 
cbssystems niehr Zeit kosten 
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lediglich bei der Sianopiion 
eines ncuen Prozesses das Flag 
PvmTask Debug geseizt werdcn. 
Dadurch siartci zunachsi ein 
Debugger (z. B. xxgdb) aufdem 
jewel I ig en Rechner. Setzi man 
die Variable DISPLAY vor dem 
Stan von pvm enisprechend. holt 
der X-Server die Bildschinman- 
zeige auf den lokalen Rechner: 

jelenv DISPUY hoscO.O 
setenv PVM^EXPORT DISPLAY 

xpvni. eine grafische An- 
vvendung. zeigl die ausge- 
tauschten Nachrichien und die 
Zustiinde der Prozesse. Diese 
Analy.se kostei aber Rechen- 
zeii. weil die Knoien fiir jedcs 
anzuzeigende Ereignis enispre- 
chende Nachrichien an xpvn> 
senden mussen. 

Fralctal parallel 

Als Beispiel Ciir PVM-Pro- 
grammierung fmden Sie auf 
Seite 151 und erweiicri in der 
c'l-Mailbox sowie auf www. 
heise.de/ct/rip/ ein Para lie I- 
programm fiir das Apfelmiinn- 
chen. Das Listing isi mil nur 
wentgen Koriimcniaren auch 
ohne PVM-Handbuch verstand- 
lich - ein weiterer Pluspunki fiir 
diese Schnitistelle. Historischc 



Anmerkung: c't hat auch 
schon uber eine Cluster- Versi- 
on dieses Algorithm us auf Ba.sis 
von Windows und DCOM bc- 
richtet. [4| 

Weil jedes Pixel des Apfel- 
mannchcns getrenni von alien 
anderen bercchnei wird. emp- 
Hehlt sich Data Decompo.siiion: 
Eine zentrale In.sianz zerlegi 
das Bild in Unterbereiche und 
veneilt diese auf mehrere 
Arbeiisprozesse. Die feinsie 
Granularitai besiiinde darin. 
jedem Prozessor genau ein 
Pixel zur Berechnung zu geben. 
Nun verfugi abcr nicht jeder 
iiber 800 x 600 Prozessoren - 
und auBerdeni wiire der zentrale 
Prozeli dermaBen lange mil dem 
Verschicken und Empfangen 
der Daten beschaftigi. daB er 
den Geschwindigkeitsgewinn 
ausbremst. Sinnvollerweise leili 
der zentrale Prozcli das Bild in 
Sireifen ein und .schicki deren 
Eckkoordinaten an die Arbeiter*. 
Auch hier ist ei elflzienier. 
zusammenhangende Blocke zu 
verschicken. 

Leichi ist bei diesem Bei.spiel 
auch eine Fehlerioleranz her- 
zusiellen. Der Master konnte 
zunachst Proiokoll dariiber fiih- 
ren. welche Aufirage die Wor- 
ker erhaltcn haben. Solite ein 



Worker ausfallen oder block ien 
sein und deshalb in vemunl"iiger 
Zeit kein Resuliat melden. gibt 
der Master des.«;en Aufirag einem 
wciiercn Worker, der keine Be- 
rechnung mehr auszultihren hat. 
Jn der Praxis lau fen Programme 
eher Stunden und Tage als Se- 
kunden. so daB A us fa lie durch- 
aus wahrscheinlich sind. Wer- 
den die Rechner des Clusters 
auch anderweiiic gcnuizt. kommi 
es obendrein zu Last.schwan- 
kungen. Hier konnte ein Vonei- 
lungsproiokoll ansetzen. 

Im Standardunifang des 
PVM-Pakeis fmdei sich auch 
eine grafische Version der Ap- 
lelmiinnchen- Berechnung na- 
mens xep. Die leriigen Bild- 
sireifen landcn sofon auf dem 
Monitor: Der .Master frischt die 
Anzcige auf. sobald Worker 
neue Datenpakeie schicken. 

Haben die Rechner des 
Clusters Kontaki (Remote-Login 
mil rsh oder ssh muB funkiio- 
nicren). laBt sich xep schnell in 
Betrieb nchmen. Man erzeut:i 
eine Texidalei namens ho.sttlle. 
in welcher Zeile fur Zeile die 
IP-Nummern der Cluster- Rech- 
ner aufgelisiei sind. Daim rufi 
man aufdem zentralen Rechner 

pvm hostfile 



als die lokale Berechnung von 
vorhandenen Teilproblemen. 
Venneidei man jedoch den 
Austausch von Kontrollnach- 
richten. kann die parallele Aus- 



fiihrung leiden - indem Prozes- 
soren nach ceianer Arbeit ohne 
neue Aufgaben bleiben und 
damit die Gesamtleistung ver- 
schlechiem. 



Atoll-PCI-Korte 



Aroll-Chip 




PClBus 



Daher geht der Trend dahin. 
Cluster mit schnellen Verbin- 
dungcn zu betrciben. Im Ver- 
gleich zu Fast Ethernet - mit 
seinen Laienzzeiten von meh- 
reren hundert psec - verkiirzen 
Produkte wie Myrinct, SCI 
Oder Atoll diese Zeiien auf 
eiwa 10 usee. Die User Level 
Communication' umgeht das 
Beiricbssysiem. span damit 
des.sen zcitraubende Funkiions- 
aufrufe und vergroBen die 
Bandbreite. Eingeschriinki nur 
noch durch die Leisiung 
der PCI-Bndge, erreicht man 
Werte bis zu 100 MByte/s. 
Spezielle PVM- Vcrsionen sind 
fiir deranigc Netzwerke opti- 
mien worden. 

Die on der Universitaf 
Mannheim enhwickehe AlolK 
Karle (Hordwarelcosten 
CO. 1000 Mark) teilt jedem 
Hauptprozetsor eines 
Vierfoch- Boards eines der 
vier Devices zu. 1 5) 
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;uH urul vcrl;iGi p\ ni i;lcich u ic- 
Jcr mil i|uii. Dcr BctchI xcp & 
sianci nun die PVM-Diimonen 
iind die BcrcchnuMi!: Nur wcniuc 
TusicndruL'kc tin den Beniiizcr, 
aber ein «:roBcr Schiin i'iiv die 
Rechcnlcisiuni:. (jj) 
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ini 
t 



toordina:?^ des Sireifenj*/ 



) 



lainfint argc, char 

int ■ytid; 
inl •astertid; 
doublt i1, yl, i^, T 
int wd, hi; 
char 

int %\6; 
■ ytia = p»»_i»ytid(); 

/. juf Anfrjge -artfr., 5r6.7e ,n: f.=ord:nat-t» e.pfangen 
while ((aid = pva rtcvl-l, IJV > 0' ( 

pirOufinfot.Td, (int.::, .--^rog 

/• entpatke Infofiat=:n 

pv»_uftpackf(":if :i* :it :i! 

/• berechfif das Biii •/ 
pi» = calc.tileJ tl, yl, 
/» packs berechf»*te 5atfn •/ 
pv»_pacif :.c", ?vfl3a:i0f*5(;i: 
/• sende Bilddaten an i(a$t*r 
'* <Pv«^seftd(«astfrtirf, ?>) 

Jp^intMjtdfrr, "feM-r te'^ Sf nien. \n" ) • 

) 

pva_e> i ! ( ); 



»<1, Jyl, ty?, Ud, tht); 



"d • hi, pii); 



'■• eigentl-che flandeltsrol-eechnunc 

char. calc.tile(doubU ,1, doubt. ,-,icubte .?,co.bte r?,int .d,int Kt) 

'7- aktueiles Pi, el •/ 

'^''"^'f 7; Kealtfil, I.ajinirteil •/ 

register double ar, ai; /. ik.u.Ualo- W 
rejister doyble al, a?; 

register i.t ite; akioelle ?ah. der Iterationen W 

i* (-d < III .d > 2048 Ii ht < I II ht > ?0i8) ( 
•printf(stderr, -faliche B.-f : re /tibhe\n") - 
pvB e^it(); 
^Iit{!); 
) 

pii = (charOiallc::i,d • ht^- 
1? -= il; 

for (ty i ht; ir-- > fl; ) { 
y = (iy • r^J / ht'* yt; 
ior til = j,,- , jj.'i f 

« = »> • iZ; /■ wd' t): 
ar = 
ai = r; 

*or (ire : 0; ite < i5>; Me-*/ f 
3 J = i'ar » ar); 
= iai • ai); 
ial ♦ »( > 4,0) 
break; 
ai = ? . 3i . ar * v; 
^ ar t ,1 - 3^ . 

J pxiir • * ii] = -ite; 

} 

.••Turn pii; 



eUHen B,ld,„e.fe« er berechnen ,oH. „nd ,e„del sein Irg^ebl;;* 



^include <»tdio.h> 
'include 'pv»3.h- 

char ••andelbrotO; 

int fiprocfssors = 1; 
in* 'priids = 0; 



/• entbilt spiter im der Prozessorrn ./ 
ieigl spater auf Arrar ■it Ta$k-IOs W 



^Ji^ii^V'' '''' ^^r».ex,r: Breite Hohe 



int ■ylid; 
inl wd, ht; 

rfouble il, ,1, I?, r?; 
cnar •pii; 
int i; 

' *toi(ar9¥ClJ); 
>t = «toftargirC33)- 
«2 = aiof(arg»(5]> 



"1 H i2 7l 



I* •eine Task-lO*/ 
/• Bttdgrofie */ 
/• Eckpunkte t/ 
■ /♦ Bilddaten ♦/ 

/♦ Indei fur frozeS •/ 
ht = aioi(argvCe)); 
yl ' *toft«rgvC43); 
, , - ' ' = atof(argvt6]>; 

Hvtid = p«.iytid()) < 0) eiitd)- 
n«- .T!- f."** Projessoren der Clusters •/ 

prnds = itint.)«aUoc(nprocessors * sizeof ( int )); 
• or n - 0; I < nproeessors; m+) ' 

W fPvVP«n(".tile-, (chafOO, 0, t, tprtidsCil) < fl) 

^ pvi^eiitO; eii((0); 

char* •andelbrotfdouble x?, double y1 doubt* .? m , - 

char .pi, = 0; //berechneVA ^' ^"^ ''t) 



char tpii = 0; 
char .tile = 0; 
ioi •tpos; 
int aaxud = 0; 
int slavetid; 
int md; 
double lyiyCtJ; 
int 1- i; int 



♦ berechneies Bild */ 
f* Oaten eines Streifens ♦/ 
/• Position eines Streifens •/ 
/• ■aiiftale Breite eines Streifens •/ 
/* Proiessof-ID ♦/ 
f* Breite ♦/ 
int ndhtC?); 
. , y; char *b»l, tba?; 

pii = (thart)Balloc(itd • ht); 

^Po!"-\'liMLMnJf?''" ^u-eisong an Prozessoren 
tpos - .tO.al 0 ((nprocessors ♦ t) . siieof(int)); 

^s;7r:1r^r^;;^^:J:::^^ -ozessoren.^n-,; 

/* bereile Puffer vor •/ 
pvB_initsend(p¥»OataDefault)- 

\V • "Processors; 

" ' """^ = idhttO]; 

/• verpacke Bilddaten t/ 

pv-.pkdouble(iy,y, t); pv._pk inK-dht, 2, D- 
/• sende Daten an Prozefl */ ' ' ' 

if (pvt,$end(prtid$Cil, 1)) { 

i«j:!.'nr;;i;[;j! ^."-.n « <:.>,„-, 

J »yi)ft03 ^ lyiyC?]; 

/. {.pfange Oaten „nd fOge sie zusa..en ./ 
lite = (chart)Baiioc(iajiid • ht)- 
JprinUtstderr, -Prozessoren antvirten : ") ■ 
Tor ti = 0; i < nproccssors; i*t) { 

/• i-'ntPrsurhe eingejar.gene Hachrichtcn ./ 
pv.. uf.nfo(pv,,3etrbuft), «j, tintOO, IslaveridI; 
lof W - U, J < nsrccessors; i**) 

)f (prtidsij) -.z slavetid) break; 
It <} < nprocessors) ( 

t';;'-'!!'!?*"',; '*l"^''(stderr); 
twd - tposCj ♦ IJ - tposCj]; 

/* jntpacke Nacbricht •/ 

P¥»_upkb)rte(tile, tud * ht, 1)- 

bal = tite; ba2 = pi, . tpostjj; 

Tor (y = hi; y-- > 0- ) { 

BC0?T(ba1, ba?, twd); bal ♦= iwd- 



prtidsCi]); 



} 



ba? *: wd; 



) 

*rfe(tDos); 
ret'jrn pit; 



freettUe); 



151 



DCtD: <XP e23045A_l_> 



